학습목표

  1. Series 함수 활용하여 데이터 분석하기
In [1]:
import numpy as np
import pandas as pd

Series size, shape, unique, count, value_counts 함수

  • size : 개수 반환
  • shape : 튜플형태로 shape반환
  • unique: 유일한 값만 ndarray로 반환
  • count : NaN을 제외한 개수를 반환
  • mean: NaN을 제외한 평균
  • value_counts: NaN을 제외하고 각 값들의 빈도를 반환
In [5]:
s = pd.Series([1, 1, 2, 1, 2, 2, 2, 1, 1, 3, 3, 4, 5, 5, 7, np.NaN])
s
Out[5]:
0     1.0
1     1.0
2     2.0
3     1.0
4     2.0
5     2.0
6     2.0
7     1.0
8     1.0
9     3.0
10    3.0
11    4.0
12    5.0
13    5.0
14    7.0
15    NaN
dtype: float64
In [12]:
len(s)
Out[12]:
16
In [14]:
s.size
Out[14]:
16
In [16]:
s.shape
Out[16]:
(16,)
In [19]:
s.unique()
Out[19]:
array([ 1.,  2.,  3.,  4.,  5.,  7., nan])
In [21]:
s.count()
Out[21]:
15
In [25]:
s.mean()
Out[25]:
2.6666666666666665
In [27]:
s.value_counts()
Out[27]:
1.0    5
2.0    4
5.0    2
3.0    2
7.0    1
4.0    1
dtype: int64
In [29]:
a = np.array([2, 2, 2, np.NaN])
print(a.mean())
b= pd.Series(a)
print(b.mean())
nan
2.0

head, tail 함수

  • head : 상위 n개 출력 기본 5개
  • tail : 하위 n개 출력 기본 5개
In [30]:
s.head(3)
Out[30]:
0    1.0
1    1.0
2    2.0
dtype: float64
In [31]:
s.tail(2)
Out[31]:
14    7.0
15    NaN
dtype: float64